Análise Experimental de Bases de Dados Relacionais e NoSQL no Processamento de Consultas sobre Data Warehouse
نویسندگان
چکیده
Data warehouse (DW) is a large, oriented-subject, non-volatile, and historical database, and an important component of Business Intelligence. On DW are executed OLAP (Online Analytical Processing) queries that often culminate in a high response time. Fragmentation of data, materialized views and indices aim to improve performance in processing these queries. Additionally, NoSQL (Not only SQL) database are used instead of the relational database, to improve specific aspects such as performance in query processing. In this sense, in this paper is investigated and compared DW implementations using relational databases and NoSQL. We evaluated the response times in processing queries, memory usage and CPU usage percentage, considering the queries of the Star Schema Benchmark. As a result, the column-oriented model implemented by the software FastBit, showed gains in time of 25.4% to 99.8% when compared to other NoSQL models and relational in query processing. Resumo. Data warehouse (DW) é uma base de dados orientada à assunto, não volátil, histórica e volumosa, sendo um componente importante da inteligência de negócio. Sobre DW incidem consultas OLAP (Online Analytical Processing) que frequentemente culminam em um alto tempo de resposta. Fragmentação de dados, visões materializadas e estruturas de indexação objetivam melhorar o desempenho no processamento dessas consultas. Adicionalmente, banco de dados NoSQL (Not only SQL) são usados como alternativa dos banco de dados relacionais, visando melhorar aspectos específicos, tal como o desempenho no processamento de consultas. Nesse sentido, neste trabalho é investigado e comparado implementações de DW usando banco de dados relacionais e NoSQL. Foram avaliados os tempos de respostas no processamento de consultas, o uso de memória e o uso porcentual de CPU, considerando as consultas do Star Schema Benchmark. Como resultado, o modelo orientado a coluna implementado pelo software FastBit, apresentou ganhos de reduções de tempo de 25,4% a 99,8% se comparado aos outros modelos NoSQL e relacional, no processamento de consultas.
منابع مشابه
Recomendações para fragmentação horizontal de bases de dados XML
Resumo. A grande quantidade de dados XML disponíveis na Web e dentro das organizações traz consigo um grande desafio no processamento de consultas sobre ambientes distribuídos. Surge então a necessidade da aplicação de técnicas que permitam um processamento de consultas mais eficiente. Neste sentido, técnicas de fragmentação de dados e processamento paralelo de consultas sobre bases de dados di...
متن کاملProcessamento de Consultas XML usando Máquinas de Inferência
Resumo. Processamento de consultas XML sobre grandes bases de dados pode sofrer de problemas de desempenho. Em trabalhos anteriores, mostramos que algumas consultas XML, quando executadas usando uma máquina de inferência, são processadas mais rapidamente do que sua equivalente em XQuery. No entanto, para se beneficiar desse bom desempenho, é necessário traduzir consultas XML para a linguagem ló...
متن کاملUso de Anotações Semânticas para Exploração de Paralelismo em Workflows Intensivos em Dados
Applications that analyze large volumes of data are often modeled as interconnected activities (workflows) and executed on high-performance platforms. Data partitioning and replication can make the activities parallelizable. However, to define a model that results in an efficient use of the platform is not trivial. This paper proposes semantic annotations to characterize the data processing in ...
متن کاملUso de SGBDs NoSQL na Gerência da Proveniência Distribuída em Workflows Científicos
Resumo. Um fator fundamental na gerência de experimentos modelados como workflows científicos são seus dados de proveniência. Esses dados basicamente são usados para garantir a reprodutibilidade, porém nos últimos anos eles também vêm sendo usados para tarefas de monitoramento e escalonamento de atividades. Como essas tarefas demandam consultas em tempo real, conforme a quantidade de dados de p...
متن کاملProcessamento de consultas na Web de Dados: uma abordagem para busca de fontes de dados relevantes
The adoption of Linked Data principles has contributed towards the creation of a Web of Data, allowing the development of applications and tools which run queries over available information. One of the main challenges for the query processing over the Web is the selection of relevant sources, i.e., sources which could contribute significantly to the result of a query. In this paper, we discuss ...
متن کامل